Search CORE

7 research outputs found

SPRINT: Scalable Policy Pre-Training via Language Instruction Relabeling

Author: Lim Joseph J.
Pertsch Karl
Zhang Jesse
Zhang Jiahui
Publication venue
Publication date: 29/01/2024
Field of study

Pre-training robot policies with a rich set of skills can substantially accelerate the learning of downstream tasks. Prior works have defined pre-training tasks via natural language instructions, but doing so requires tedious human annotation of hundreds of thousands of instructions. Thus, we propose SPRINT, a scalable offline policy pre-training approach which substantially reduces the human effort needed for pre-training a diverse set of skills. Our method uses two core ideas to automatically expand a base set of pre-training tasks: instruction relabeling via large language models and cross-trajectory skill chaining through offline reinforcement learning. As a result, SPRINT pre-training equips robots with a much richer repertoire of skills. Experimental results in a household simulator and on a real robot kitchen manipulation task show that SPRINT leads to substantially faster learning of new long-horizon tasks than previous pre-training approaches. Website at https://clvrai.com/sprint.Comment: 29 pages, 18 figures. Published at ICRA 202

arXiv.org e-Print Archive

PATO: Policy Assisted TeleOperation for Scalable Robot Data Collection

Author: Dass Shivin
Lee Youngwoon
Lim Joseph J.
Nikolaidis Stefanos
Pertsch Karl
Zhang Hejia
Publication venue
Publication date: 09/12/2022
Field of study

Large-scale data is an essential component of machine learning as demonstrated in recent advances in natural language processing and computer vision research. However, collecting large-scale robotic data is much more expensive and slower as each operator can control only a single robot at a time. To make this costly data collection process efficient and scalable, we propose Policy Assisted TeleOperation (PATO), a system which automates part of the demonstration collection process using a learned assistive policy. PATO autonomously executes repetitive behaviors in data collection and asks for human input only when it is uncertain about which subtask or behavior to execute. We conduct teleoperation user studies both with a real robot and a simulated robot fleet and demonstrate that our assisted teleoperation system reduces human operators' mental load while improving data collection efficiency. Further, it enables a single operator to control multiple robots in parallel, which is a first step towards scalable robotic data collection. For code and video results, see https://clvrai.com/patoComment: Website: https://clvrai.com/pat

arXiv.org e-Print Archive

Q-Transformer: Scalable Offline Reinforcement Learning via Autoregressive Q-Functions

Author: Chebotar Yevgen
Finn Chelsea
Gopalakrishnan Keerthana
Hausman Karol
Herzog Alexander
Ibarz Julian
Irpan Alex
Jackson Tomas
Kumar Aviral
Levine Sergey
Lu Yao
Manjunath Deeksha
Nachum Ofir
Peralta Jodilyn
Pertsch Karl
Rao Kanishka
Salazar Grecia
Singht Jaspiar
Sontakke Sumedh
Tan Clayton
Tran Huong T
Vuong Quan
Xia Fei
Yu Tianhe
Zitkovich Brianna
Publication venue
Publication date: 18/09/2023
Field of study

In this work, we present a scalable reinforcement learning method for training multi-task policies from large offline datasets that can leverage both human demonstrations and autonomously collected data. Our method uses a Transformer to provide a scalable representation for Q-functions trained via offline temporal difference backups. We therefore refer to the method as Q-Transformer. By discretizing each action dimension and representing the Q-value of each action dimension as separate tokens, we can apply effective high-capacity sequence modeling techniques for Q-learning. We present several design decisions that enable good performance with offline RL training, and show that Q-Transformer outperforms prior offline RL algorithms and imitation learning techniques on a large diverse real-world robotic manipulation task suite. The project's website and videos can be found at https://q-transformer.github.ioComment: See website at https://q-transformer.github.i

arXiv.org e-Print Archive

Modal perspective on the transverse Anderson localization of light in disordered optical lattices

Author: Anderson
Anderson
Arash Mafi
Berry
Chabanov
Christodoulides
De Raedt
Eberly
El-Dardiry
Gaeta
Ghosh
John
John
Jovic
Karatsuba
Karbasi
Karbasi
Karbasi
Karbasi
Karl W. Koch
Kartashov
Kartashov
Keil
Lagendijk
Lahini
Lee
Lenahan
Leonetti
Mafi
Mafi
Mafi
Martin
Pendry
Pertsch
Salman Karbasi
Schwartz
Soukoulis
Soukoulis
Stockman
Szameit
Vellekoop
Publication venue: 'The Optical Society'
Publication date
Field of study

Crossref

The Lives and Afterlives of Vis and Rāmin

Author: Abdi Laylā
Abi al-Khayr Irānshāh ebn
Agapitos Panagiotis A.
Akhyāni Jamileh.
Amin Ahmad al-Rāzi.
Arrajāni Farāmarz ebn Khodādād
Askari Nasrin.
Baldick Julian.
Banāni Amin.
Barādarān Shokuh.
Bausani Alessandro.
Borjian Habib.
Boyce Mary.
Boyce Mary.
Browne Edward G.
Bürgel J. Christoph.
Bürgel J. Christoph.
Bürgel J. Christoph.
Cameron Cross
Christensen Arthur.
Cross Cameron.
Dastgerdi Vahid.
Davis Dick.
Davis Dick.
Davis Dick.
De Blois François.
Dorri Zahrā
Dronke Peter.
Dāmghāni-Sāni Kāzem.
Emāmi ʿAli-Rezā
Ephrat Daphna.
Eqbāli Ebrāhim
Eslāmi-Nodushan Mohammad-ʿAli.
Eslāmi-Nodushan Mohammad-ʿAli.
Eslāmi-Nodushan Mohammad-ʿAli.
Eslāmi-Nodushan Mohammad-ʿAli.
Ethé Hermann.
Foruzandeh Masʿud
Foruzandeh Masʿud
Foruzandeh Masʿud
Foruzandeh Masʿud
Gabrieli Francesco.
Gabrieli Francesco.
Gaillard Marina.
Gallais Pierre.
Ganjavi Nezāmi
Ganjavi Nezāmi
Gibb E. J. W.
Gippert Jost.
Giunashvili Jemshid.
Godarzpur-ʿErāq Afsun.
Gorgāni Fakhr al-Din.
Gorgāni Fakhr al-Din.
Gorgāni Fakhr al-Din.
Gorgāni Fakhr al-Din.
Gorgāni Fakhr al-Din.
Gorgāni Fakhr al-Din.
Gorgāni Fakhr al-Din.
Graf Karl Heinrich.
Gvaxaria Alek’sandre.
Hedāyat Rezā-Qoli Khān.
Hedāyat Sādeq.
Hādi Ruh-Allāh
Hākemi Ismāʿel
Ivanow Wladimir.
Jaffery Yunus.
Javādi Sayyed Ziyāʾ al-Din.
Jayhāni Hamid-Rezā
Jāmi ʿAbd al-Rahmān.
Kahduni Mohammad-Kāzem
Kakar Sudhir
Kappler Claude-Claire.
Kappler Claude-Claire.
Kappler Claude-Claire.
Khaleghi-Motlagh Djalal.
Khaleghi-Motlagh Djalal.
Khorāsāni Mahbubeh
Khosrow Nāser-e
Kobidze David.
Kunitzsch Paul.
Kunitzsch Paul.
Latif-Nezhād Farrokh.
Lazard Gilbert.
Lewis Franklin D.
Mahjub Mohammad Jaʿfar.
Mahjub Mohammad Jaʿfar.
Mamatsashvili Maja
Massé Henri.
Massé Henri.
Mazdāpur Katāyun.
McCann W. J.
Meisami Julie Scott.
Meisami Julie Scott.
Minorsky Vladimir.
Minovi Mojtabā
Mohaqqeq Mahdi.
Molé Marijan.
Moretti Franco.
Morrison George.
Mostowfi Qazvini Hamd-Allāh.
Nezāmi ʿAruzi.
Nezāmi ʿAruzi.
Nushin ʿAbd al-Hosayn.
Nöldeke Theodor.
Okada Emiko.
Orsatti Paola.
Owhadi Balyāni Taqi al-Din.
Pertsch Wilhelm.
Piri Musā
Piri Musā
Pizzi Italo.
Pourjavady Nasrollah.
Rayfield Donald.
Rieu Charles.
Rieu Charles.
Ringgren Helmer.
Rostami Roqiyeh.
Russell James R.
Rust’aveli Shot’a.
Rust’aveli Shot’a.
Ruyāni Vahid.
Rādfar Abu al-Qāsem.
Sachau Eduard
Salmāni Hamid-Rezā
Samarqandi Dowlatshāh
Schefer Charles Henri Auguste
Schröder Franz Rolf.
Seyed-Gohrab Ali Asghar.
Shehābi ʿAli-Akbar.
Shādārām ʿAli-Rezā
Southgate Minoo S.
Sprachman Paul.
Sprenger Alois.
Sādiqiyān Mohammad-ʿAli
Tabrizi Abu al-Majd Mohammad ebn Masʿud.
Tafazzoli Ahmad.
Tamimdāri Ahmad.
Tarbiyat Mohammad-ʿAli.
Taslimi ʿAli
Tchikovani M.
Troyes Chrétien de
Tājbakhsh Esmāʿil
T’mogveli Sargis.
Von Stackelberg Baron R.
Von Stackelberg Baron R.
Vāleh ʿAli-Qoli Khān.
Vāredi Zarrin-tāj
Whetter K. S.
Yusofi Hosayn-ʿAli.
Zamānzādeh Javād.
Zarrinkub ʿAbd al-Hosayn.
Zenker Rudolf.
Zipoli Riccardo.
Çelebi Kâtip
Ārzu Serāj al-Din ʿAli Khān.
Āzar Bigdeli Lotf-ʿAli Bayg.
ʿAbd al-Kādir Sarfarāz Khan Bahādur.
ʿAbd-Allāhiyān Hamid.
ʿAbdi Laylā
ʿAttār Farid al-Din.
ʿAttār Farid al-Din.
ʿEmād Faqih ʿAli ebn Mahmud.
ʿEshqi-Sardehi ʿAli
ʿObayd-e Zākāni Nezām al-Din.
ʿObayd-e Zākāni Nezām al-Din.
ʿOwfi Mohammad.
ʿĀmeli Nāser.
Publication venue: 'Informa UK Limited'
Publication date
Field of study

Crossref